非随机研究的系统评价_1非随机化研究系统评价的必要性

非随机研究的系统评价

http://www.100md.com 中医循证医学

     刘建平

    (四川大学华西医院中国循证医学/Cochrane中心成都 610041)

    1 非随机化研究系统评价的必要性

    循证医学强调利用最佳研究证据进行临床和医疗卫生决策。然而，所谓"最佳证据"是相对而言的，是根据决策者所能够得到的证据而言。在卫生资源则对匮乏的发展中国家，有时候要想获得高质量的研究证据是困难或不可及的，此时的卫生决策在很大程度上依靠于经验或有限信息。这在发达国家和发展中国家是客观存在的现实差异问题。因此，Cochrane协作网强调的原则之一就是利用可获得的最佳证据来决策。

    进行系统评价是鉴定并获取证据的最佳方法。系统评价的目的在于收集所有可得到的证据，评估证据运用于解决临床问题的实用性，分析证据的可靠性，提取资料并综合研究结果，得出结论。通常Cochrane系统评价主要依据随机对照试验(RCT)的结果进行评价，后者被认为是使研究结果免于偏倚的最佳研究设计方案，即判断治疗效果的"金方案"。如果运用正确可控制混杂和偏倚因素，使结果尽量客观真实。然而，有些情况下进行随机对照试验是不恰当、不适合甚至由于伦理问题是不可能的。因此，有的系统评价将高质量的观察性研究纳入系统评价之中，与RCT的结果进行敏感性分析，或用明确的规定进行观察性研究的系统评价。此外，有时RCT研究的问题不能涉及一些重要的医疗卫生问题。非随机性研究可能会解决这样一些重要的临床问题。如1991年一项对俯卧姿势睡眠与儿童摇床偶发死亡事件之间关系得到了观察性研究系统评价结论支持(Beal 1991)，并被随后的一项全国范围的干预计划引致儿童摇床死亡事件率下降的研究进一步证实。当然一些有限的经验性研究证据表明非随机性研究倾向于夸大治疗效果(Sacks 1982，Kunz 1998)。
, http://www.100md.com
    已有的研究结果表明，与RCT的Meta分析(荟萃分析)结果比较，纳入非随机的对照试验并未改变RCT的综合结果，两者所得到的结果无显著性差异。当然，也有观察性研究系统评价结果与RCT不相符合的情况。如近年发表的对停经妇女进行的激素替代治疗观察性研究系统评价结果(有效)并未得到随后大规模RCT结果(无效)的支持。当缺乏或没有足够数量的RCT时，可进行非随机对照研究的系统评价。RCT与观察性研究在某种程度上可以起互补作用。高质量的观察性研究可以使研究证据延伸应用到更广泛的人群(增加随机化研究结果的可应用性)，同时用于鉴定干预措施的有害性(副效应)上有更大的优越性。目前，Cochrane图书馆已有这类系统评价报告发表。如Cochrane药物与酒精依赖评价组和Cochrane外科疾病评价组就已进行了多项非随机试验的系统评价。Cochrane，协作网于1999年在丹麦哥本哈根正式成立了"Cochrane非随机对照研究方法学小组"(http//www.cochrane.dk/nrsmg/)，也说明非随机对照研究系统评价对某些医疗卫生问题的重要性。该方法学组专门从事医疗卫生干预措施非随机研究系统评价和方法学研究，目前正在编制非随机研究系统评价方法指南，预计2001年底完成，届时可在网上查询。
, 百拇医药
    国内学者对近二十年来我国期刊杂志上发表的临床试验进行文献评价的结果表明，尽管RCT发表的数量在逐年增长，但临床试验仍以非随机研究为主。而且在过去40年中，发表的非随机对照研究数量逐步增长。此其是中医药临床研究领域仍以非随机化研究报告为主。以病毒性肝炎中医药治疗研究为例，目前全国批准上市的治疗肝炎的中草药制剂有300余种，国家每年用于肝炎的治疗费用高达300～500亿人民币。然而，据作者2000年末的检索，尚没有一篇关于这些药物治疗效果或费用效益的系统评价发表。而近年来文献发表的临床试验每年在200篇以上。因此，这是一个急需要进行系统研究的领域。

    2 非随机研究的设计类型

    非随机研究(non-randomized studies)的设计类型包括前瞻性的同期对照试验(prospective concurrent controlled trial，如交替分配试验对象的对照临床试验和前瞻性对照试验)、历史性对照研究、无对照的观察性研究如外科手术治疗的临床研究，以及流行病学研究如队列研究(cohort study)、病例对照研究(case-control study)和描述性研究如现况调查、病例系列分析(case series)等类型。其论证强度(设计的严谨性、论据的可靠性、结论的准确性，)依次减低(表1)。因此，不同类型的非随机研究其证据的真实性和偏倚的程度也不相同。因此对证据强度的分类有助于判断结论的可靠程度，由此产生用于推荐决策所采用的证据。一些病因危险因素研究和诊断性试验就属于观察性研究。
, http://www.100md.com
    表1 不同设计类型的证据分类及决策建议

证据的分类

Ⅰa级----来自随机对照试验Meta-分析的证据

Ⅰb级----来自一个或多个随机对照试验的证据

Ⅱa级----来自一个或多个半随机或前瞻性对照试验的证据

Ⅱb级----来自一个或多个历史性对照试验或无对照的前瞻性研究的证据

Ⅲ级----来自观察性研究，包括分析性的队列研究和病例对照研究、描述性的病例分析等

Ⅳ级----来自专家委员会报告、观点或权威人士的临床经验，如评述、综述

证据用于决策的强度

A级----直接用Ⅰ级证据进行的决策

B级----直接用Ⅱ级证据进行决策或由Ⅰ级推论而来的证据进行决策

C级----直接用Ⅲ级证据进行决策或由Ⅰ、Ⅱ级推论而来的证据进行决策

D级----直接用Ⅳ级证据进行决策或由Ⅰ、Ⅱ或Ⅲ级推论而来的证据进行决策

, 百拇医药
    可见，非随机研究在方法学有其局限性和不足之处。主要问题是如何防止和评价可能存在的偏倚问题。循证医学强调最佳的医疗质量要求应用最佳的科学证据。检验临床假设的最好方法是RCT。在能够获得RCT证据的情况下最好采用随机试验的结果。非随机研究尤其是观察性研究的缺点在于其论证强度低，设计的偏倚可能会引至错误的结论。因此采用非随机研究的系统评价在做结论时应特别慎重，对纳入试验的质量进行严格评价是极其重要的。有人认为盲法较随机化更加重要，而在非随机试验中采用盲法将减低偏倚的影响，从而提高试验的质量。

    3 非随机研究系统评价的用途

    制作、发表、传播系统评价，使其得到应用，最终目的是促进临床实践质量、辅助卫生决策或提出新的研究课题。在已有随机对照试验的证据时，纳入非随机研究的证据会对系统评价结论进行补充或辅证。在没有随机对照试验的情况下，非随机的观察性研究将对进一步的对照试验提供有价值的信息或线索。非随机研究系统评价的结果将特别应用于探讨或澄清疾病的病因或危险因素、疾病的预后和影响预后的恶性预后因素、疾病的诊断或筛查以及某些干预措施效果的评价。随着非随机研究设计质量的提高和完善，非随机研究系统评价在医疗卫生领域的作用将会随之增大。
, http://www.100md.com
    非随机研究的系统评价适用于下列情况:(1)系统的研究疾病的病因或危险因素，或探讨疾病发生发展的预后因素；(2)临床治疗领域尤其是外科手术治疗、吸烟、饮酒及药物成瘾治疗，当没有或极少有RCT时；(3)随机试验系统评价中纳入非随机研究，使结论的推广意义更大；(4)当临床研究者计划新的临床试验或验证新药的疗效时，对已有的非随机研究进行系统评价将有助于课题的选定；(5)诊断性试验的系统评价；(6)研究药物的毒副作用和长期罕见的负性事件。

    4 非随机研究系统评价应用的实例

    以下为非随机研究系统评价的实例，供有志于非随机研究系统评价研究者和使用者参考。

    乳腺癌成相术筛检效果的系统评价(JAMA1995；273(2)：149-154)；

    动脉血管再造对生存率的效果：比较双侧与单侧内乳动脉植入研究的系统评价。
, http://www.100md.com
    减低体重的行为对治疗Ⅱ型糖尿病效果的评价 (Diabetes Care 1996；19(6)：613-624)；

    内窥镜对消化性溃疡的治疗效果：定性资料的系统评价(Am J Med 1999；l06(3)：335-346)；工作场所HIV/AIDS干预措施的健康促进效果(Am J Health Promotion 1996；11(2):150-157)；

    人群戒烟运动中激励的使用和影响：系统评价(Am J Health Promotion 1998；12(5):307-320)

    不同护理模式对病人生活质量、心理状态与态度的影响：评价报告(英国布里斯托大学，初级卫生保健系 1997；97-113)。

     (原载于：中国循证医学 2001, 1(3)137-139), 百拇医药

百拇医药网 http://www.100md.com/html/Dir/2004/03/08/54/727.htm